Large language model scoring of medical student reflection essays: Accuracy and reproducibility of prompt-model variations
De studie concludeert dat grote taalmodellen, met name bij gebruik van fijnafstemming en voorbeelden, reflectie-essays van medische studenten met bijna perfecte nauwkeurigheid en reproduceerbaarheid kunnen beoordelen, waarbij de kosten en prestaties variëren afhankelijk van het model en de schaal.